RTX 3090_草庐IT

【完整详细教程】Ubuntu22.04 双显卡 3090Ti*2 KVM虚拟机多显卡直通与Parsec高清远程

参考文献：Ubuntu配置GPU直传kvm虚拟机-CodeAntennaKVM虚拟机GPU直通，stepbystep-机械意志(mechanical-consciousness.com)lspci的输出简单分析-成蹊0xc000-博客园(cnblogs.com)PCIpassthroughviaOVMF-ArchLinux中文维基(archlinuxcn.org)Win10/11如何开启第二屏幕/副屏/虚拟显示器，让平板成为副屏-知乎(zhihu.com)首先声明，本文的背景是在两张同型号的3090ti中选择一张进行直通，在整个直通过程中，上面的参考文献给与了我很大的帮助，本篇内容是我基于他们

Ubuntu20.04+Quadro RTX 5000，3D gaussian环境配置

文章目录0.引言1.cuda安装步骤1.1显卡驱动安装禁用系统自带驱动nvidia显卡驱动安装1.2CUDA安装1.3配置环境变量2.3Dgaussian安装3.Viewer安装0.引言2020年，NeRF的出现之际引起了轩然大波，出现了大量相关工作。3Dgaussian算是新视角生成领域目前的SOTA，可以进行实时的渲染；最大训练速度上可以与Instant相当，且质量差不多；增加迭代次数后，可以显著提高重建质量，在训练时间51min的情况下，重建效果可以稍微超过Mip-NeRF（48h）。这种好东西谁不想学习下呢，所以我们先进行第一步：配置3Dgaussian环境。我当前的环境为ubuntu

Stable Diffusion WebUI rtx 2060 6G 高清修复爆显存torch.cuda.OutOfMemoryError: CUDA out of memory.

故障日志***Arguments:('task(9bknuv75x8gvtjn)','1girl,3d,architecture,blurry,blurrybackground,breasts,brownhair,building,cherryblossoms,city,cityscape,cosplayphoto,cowboyshot,day,depthoffield,eastasianarchitecture,flower,lips,longhair,lookingatviewer,mediumbreasts,midriff,motionblur,navel,outdoors,photo\

八张3090，1天压缩万亿参数大模型！3.2TB骤降至160GB，压缩率高达20倍

随着GPT-4的架构被知名业内大佬「开源」，混合专家架构（MoE）再次成为了研究的重点。GPT-4拥有16个专家模型，总共包含1.8万亿个参数。每生成一个token需要使用大约2800亿参数和560TFLOPs。然而，模型更快、更准确的代价，则是巨大的参数量，和随之而来的高昂成本。比如，1.6万亿参数的SwitchTransformer-c2048模型，需要3.2TB的GPU显存才能有效运行。为了解决这一问题，来自奥地利科技学院（ISTA）的研究人员提出了一种全新的压缩和执行框架——QMoE。论文地址：https://arxiv.org/abs/2310.16795通过采用专门设计的GPU解码

鲁大师2022年半年报消费级电脑硬件排行数据包含2022.01.01—2022.06.30日鲁大师PC正式版测试数据。为减少小众产品（服务器）冲击榜单，使得榜单更具参考价值，数据采样选取测试个数超过1000以上，发布日期3年以内的产品，了解完整天梯排行请前往鲁大师微博查询天梯榜。处理器排行：intel 12代酷睿打开笔记本市场台式机CPU性能榜第一名依然被我们熟悉的AMDRyzenThreadripperPro3995WX占据，前三位都是AMD的线程撕裂者选手。第四名来自intel最新的12代酷睿i9-12900KS，果然CPU想要得高分还是要特挑体质才行。按照售价来算，i9-12900KS+

RTX 4070 SUPER惊喜大升级！4070 Ti都没法混了

日前有说法称，NVIDIA将在明年重新推出SUPER系列显卡，至少有RTX4080SUPER、RTX4070TiSUPER、RTX4070SUPER三款型号，这也是以第一次出现Ti、SUPER的组合。至于下一代RTX50系列，要等到2025年了。根据知名曝料者MEGAsizeGPU的最新说法，RTX4070SUPER确实足够“超级”，核心从AD104更换为更大规模的AD103，CUDA核心数量不详但必然会大大多于5888个。同时，显存位宽从192-bit开放到256-bit，容量也从12GBGDDR6X增加到16GBGDDR6X，这甚至已经超过了RTX4070Ti。RTX4070SUPER的核

在RTX 4090被限制的时代下，让大模型使用RLHF更高效的方法来了

论文链接：https://arxiv.org/abs/2310.10505作者：李子牛，许天，张雨舜，俞扬，孙若愚，罗智泉机构：香港中文大学（深圳），深圳市大数据研究院，南京大学，南栖仙策开源代码：https://github.com/liziniu/ReMax如未额外说明，所有图片来自于论文。背景今年，以ChatGPT为首的大语言模型（LargeLanguageModels,LLMs)在各个方面大放光彩，由此引发了学术界和商业界对GPU等计算资源的需求剧增。左图来自DALL・E3，右图来自DALL・E3比如监督训练地调优(supervisedfine-tuning,SFT)一个Llama2-

英伟达推出 Tensor RT-LLM，使大语言模型在搭载 RTX 的 PC 平台上运行速度提高四倍

10月18日消息，英伟达是硬件领域的生成型人工智能之王，该公司的GPU为微软、OpenAI等公司的数据中心提供动力，运行着BingChat、ChatGPT等人工智能服务。今天，英伟达宣布了一款新的软件工具，旨在提升大型语言模型（LLM）在本地WindowsPC上的性能。在一篇博客文章中，英伟达宣布了其TensorRT-LLM开源库，这个库之前是为数据中心发布的，现在也可以用于WindowsPC。最大的特点是，如果WindowsPC配备英伟达GeForceRTXGPU，TensorRT-LLM可以让LLM在WindowsPC上的运行速度提高四倍。英伟达在文章中介绍了TensorRT-LLM对开发

RTX 3080公版高温超100℃：一看散热器破了个洞！

RX7900XTX公版上市之初就被发现，真空腔均热板内冷夜不足，导致异常高温可达110℃，AMD也坦然承认了这一缺陷。最近，韩国媒体QuasarZon发现，RTX3080公版卡、RTXA6000工作站显卡也存在异常高温，很容易就会超过100℃，结果也是散热器出了问题，但情况很特殊。拆解后可以看到，RTX3080散热器与GPU表面接触的原本明亮光滑的镀镍底座上，赫然出现了一个斑点，放大后清晰地显示这部分已经出现了腐蚀现象，触目惊心。猜测是内部密封的真空腔出现了破裂，导致冷夜渗出，与铜发生了化学反应。RTXA6000上也是类似的情况，同样有一块“铜斑”。将散热底座钻孔拆开后，能看到部分铜材料已经

51单片机操作系统——RTX51 Tiny

简介RTX51是keil公司开发的一款实时操作系统，其有两个版本：1.Tiny2.Full，区别如下：RTX51Full：使用四个任务优先权完成同时存在时间片轮转调度和抢先的任务切换RTX51工作与中断功能相似的状态下，信号和信息可以通过邮箱系统在任务之间互相传递，你可以从一存储池中分配和释放内存你可以强迫一个任务等待中断超时或者是从另一个任务或中断发出的信号或信息。RTX51Tiny：仅支持时间片轮转任务切换和使用信号进行任务切换，不支持抢先式的任务切换不包括消息历程，没有存储器池分配程序。总结来说，Tiny就是RTX51Full的精简版，只有基本的任务切换功能。使用方法使用RTX51操作系